خلاصه سازی اخبار با یک روش ترکیبی خوشه بندی - ژنتیکی

پایان نامه
چکیده

با گسترش روز افزودن داده های متنی ، بدست آوردن اطلاعات مورد نظر مسئله اساسی در عصر اینترنت است. برای تطبیق با این مسئله فناوریهای جدید که قادر به پردازش داده های حجیم بصورت موثر هستند مورد نیاز است. خلاصه سازهای خودکار یکی از ابزارهای مهم در این راستاست که در حوزه های گوناگون مثل اسناد پزشکی ، مقالات علمی و آرشیو اخبار مورد استفاده قرار می گیرد. این پایان نامه به خلاصه سازی چند سندی در زبان انگلیسی می پردازد که در آن مجموعه ای از اخبار بهم مرتبط به عنوان ورودی دریافت می شود و تعدادی جمله به صورت فشرده به عنوان خروجی تحویل داده می شود.. در حالیکه اغلب رویکردهای موجود ، جملات را انتخاب کرده و سپس افزونگی را بصورت حریصانه حذف می کنند، اخیرا رویکردهای مبتنی بر بهینه سازی در تعیین کیفیت خلاصه بصورت کلی و بهره گیری از ویژگیهای جمعی جملات موثر واقع شده اند. در برخی از این روشها ، خلاصه سازی به یک مسئله بهینه سازی p-median تبدیل می شود. ما نشان میدهیم که این تقریب نادقیق است و برای رفع مشکل آن یک تابع بهینه سازی فازی جدید معرفی می کنیم که از اطلاعات موجود در خوشه های جملات مرتبط یا همان موضوعات ، استفاده می کند. برای این مقصود یک الگوریتم خوشه بندی مبتنی بر گراف معرفی می شود که خروجی آن یک ماتریس عضویت فازی است که میزان تعلق هر جمله به موضوعات درمتن را مشخص می نماید. برای بهینه سازی تابع هدف از یک الگوریتم ژنتیکی استفاده شده است که به کمک عملگرهای هوشمند بهبود یافته است و برای ارزیابی کار از مجموعه داده های duc2001 و duc2004 استفاده شده است. رویکرد ما در معیار rouge-1 بر روی این داده ها به ترتیب به دقت 0.36389 و 0.39826 می رسد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

یک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر

  The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...

متن کامل

تحلیل تغییرات ساختاری بخش‌های مشتریان با روش ترکیبی خوشه-بندی و قوانین انجمنی

بخش‌بندی مشتریان یکی از مباحث اصلی و کلیدی در مطالعات مدیریت ارتباط با مشتری محسوب می‌شود. یکی از چالش‌های مهم در بخش‌بندی مشتریان، ناپایداری و تغییرات بخش‌های مشتریان در طول زمان است. تغییرات بخش‌ها را می‌توان در دو دستة تغییرات محتوایی و ساختاری دسته‌بندی کرد. این پژوهش بر تغییرات ساختاری بخش‌ها که اهمیت زیادی دارد، تمرکز کرده است. به‌منظور تحلیل تغییرات ساختاری بخش‌ها و توصیف چگونگی این تغیی...

متن کامل

ارزیابی، رتبه بندی و خوشه بندی ریسک عملیات تونل سازی سد و نیروگاه سیمره با استفاده از روش ELECTRE

ارزیابی ریسک یکی از مراحل مهم مدیریت پروژه بوده و با توجه به ماهیت نامطمئن پروژه‌های تونل‌سازی و لزوم صرف بهینه منابع، اهمیت زیادی دارد. ارزیابی، رتبه‌بندی و خوشه‌بندی ریسک، برتری هر ریسک را بر اساس شاخص‌های مرتبط مشخص کرده و در نتیجه امکان ارائه پاسخ مناسب برای هر ریسک فراهم می‌گردد. در این تحقیق ضمن شناسایی و تعیین معیارهای اندازه گیری ریسک‌های عملیات تونل‌سازی سد سیمره، اهمیت نسبی هر ریسک با...

متن کامل

تحلیل فراوانی منطقه ای سیلاب با استفاده از روش خوشه بندی ترکیبی نگاشت ویژگی خود سامان و فازی

یکی از روش‌های تخمین چندک‌های سیلاب در حوضه‌های فاقد آمار یا با طول دوره آماری کوتاه، استفاده از روش تحلیل فراوانی منطقه‌ای است. در مطالعات منطقه‌ای، به منظور دستیابی به مناطق همگن هیدرولوژیک از تکنیک‌های خوشه‌بندی استفاده می‌شود. اخیراً در چند تحقیق از نگاشت ویژگی خود سامان(Self-Organizing Feature Maps)  استفاده شده است. اما مشکل اصلی SOFM تفسیر نقشه خروجی از این روش به‌منظور یافتن مناطق همگن ه...

متن کامل

قطعه بندی تصاویر با استفاده از روش خوشه بندی طیفی مبتنی بر سوپرپیکسل

علم بینایی ماشین یکی از علومی است که در راستای افزایش کارایی حس بینایی در سیستم‌های هوشمند به کار گرفته می‌شود. اولین گام در بسیاری از کاربرد‌های بینایی ماشین، قطعه‌بندی تصویر می‌باشد. در این پژوهش، روش خوشه­بندی طیفی با سوپرپیکسل برای قطعه­بندی تصویر ارائه شده است. با اعمال الگوریتم KFCM و با استفاده از توزیع عضویت در ماتریس بخش­بندی، یک میزان تشابه فازی هسته­ای جدید پیشنهاد داده­ایم که سبب کا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023